Dimensión Educación

Esta dimensión hace parte del estudio de la encuesta de calidad de vida de la alcaldia de Medellín 2018, para este ejercicio se seleccionaron las siguientes preguntas relacionadas a educación para la realizar del análisis.

Desarrollo de las preguntas Dimension Educación

Pregunta de la encuesta p_35

¿Sabe leer y escribir mas de un parrafo?

Posibles respuestas a la pregunta.
  * Si <- 1.
  * No <- 2.
  

Se identifica que la pregunta p_35 en su resumen inicial no tiene valores perdidos, tiene una completitud total.

Variable que se desea medir.
Indicador:
Nivel de analfabetismo en barrios de Medellín.
Formula :
Nivel de analfabetismo = Respuestas en selección 2 por Barrio / Total encuestados en el Barrio.
## # A tibble: 6 x 4
##   comuna    barrio                         p_35    k_35
##   <fct>     <fct>                          <chr>  <dbl>
## 1 ALTAVISTA AGUAS FRÍAS                    2     0.135 
## 2 ALTAVISTA ALTAVISTA CENTRAL              2     0.142 
## 3 ALTAVISTA ÁREA DE EXPANSIÓN ALTAVISTA    2     0.149 
## 4 ALTAVISTA ÁREA DE EXPANSIÓN BELÉN RINCÓN 2     0.0517
## 5 ALTAVISTA BUGA PATIO BONITO              2     0.128 
## 6 ALTAVISTA CABECERA ALTAVISTA             2     0.113

Pregunta de la encuesta p_37

¿Estudió durante este año?

Posibles respuestas a la pregunta.
  * Si <- 1.
  * No <- 2.
  * -88 <- No aplica
  
Variable que se desea medir.
Indicador:
Porcentaje de personas que estudiaron en este año.
Formula :
Total de encuentas que respondieron 1 (Si) / Total de encuentas por Barrio

Contenido de las respuestas a la pregunta p_37

## # A tibble: 3 x 2
##   p_37  cantidad
##   <chr>    <dbl>
## 1 -88      26.7 
## 2 1         1.76
## 3 2        71.5

Se encuetra que en la pregunta formulada, existe una gran cantidad de respuestas con la opción -88 (No aplica). Esta respuesta pueden tener varias consideraciones :

  • La persona encuestada, hace parte de las personas que contestaron p_35 como NO.
  • La persona encuentada, aunque contesto afirmativamente la pregunta p_35, no tiene estudios auque tiene un poco conocimiento en lecto-escritura.

Para efectos de esta pregunta en este estudio, se considerá que los encuestados en la p_37 con respuesta -88 no realizaron estudios durante el año.

## # A tibble: 2 x 2
##   p_37  cantidad
##   <chr>    <dbl>
## 1 1         1.76
## 2 2        98.2

Generación de Indicadores p_37.

## # A tibble: 6 x 4
##   comuna    barrio                         p_37     k_37
##   <fct>     <fct>                          <chr>   <dbl>
## 1 ALTAVISTA AGUAS FRÍAS                    1     0.0159 
## 2 ALTAVISTA ALTAVISTA CENTRAL              1     0.0178 
## 3 ALTAVISTA ÁREA DE EXPANSIÓN ALTAVISTA    1     0.0207 
## 4 ALTAVISTA ÁREA DE EXPANSIÓN BELÉN RINCÓN 1     0.0259 
## 5 ALTAVISTA BUGA PATIO BONITO              1     0.0208 
## 6 ALTAVISTA CABECERA ALTAVISTA             1     0.00595

Pregunta de la encuesta p_38.

¿cual es la causa principal por la que se salió de estudiar este año?

Posibles respuestas a la pregunta.
  • -99 No responde
  • -88 No aplica
  • 1 Considera que no está en edad escolar
  • 2 Considera que ya terminó sus estudios
  • 3 Los costos educativos elevados o Falta dinero
  • 4 Debe encargarse de los oficios del hogar.
  • 5 Falta de tiempo
  • 6 Por embrazo
  • 7 Por inseguridad en el establecimiento educativo, en el entorno del establecimiento o en el lugar de residencia
  • 8 Falta de cupos
  • 9 No existe centro educativo cercano. El establecimiento asignado está muy lejano
  • 10 Necesita trabajar
  • 11 No le gusta o no le interesa el estudio
  • 12 Por enfermedad o incapacidad física
  • 13 Necesita educación especial
  • 14 Recibe malos tratos en el colegio
  • 15 Porque se casó o formó pareja
  • 16 Tuvieron que abandonar el lugar de rsidencia habitual
  • 17 Bajo rendimiento académico o indisciplina
  • 18 No pudo conseguir los documentos que exigían
  • 19 Razones familiares
  • 20 Prestar servicio militar
  • 21 Falta de comprensiónn de su identidad étnica (cultura, idioma o lengua)
  • 22 Ingreso a un programa de rehabilitación por consumo de sustancias psicoactivas

Indicador definido.

Indicador:

  • Porcentaje de desescolarización debido a la falta de garantias en barrios de Medellín.

Formula del indicador:

  • Numero de encuestas con respuestas orientadas a la falta de garantias / Total encuestados en Barrios.

Para consolidar la variable en terminos de indicador se consolidaron las repuestas de la pregunta p_38 en los siguientes grupos :

  • Otras Actividades - O - (-99,4,5,15,17,18,19,20,22 )
  • No aplica - N - (-88)
  • Motivación - M - (1,2,11)
  • Económico - E - (3,10)
  • Salud - S - (6,12,13)
  • Garantias - G - (7,8,9,14,16,21)

Generación de indicador para la p_38

## # A tibble: 6 x 4
##   comuna    barrio               p_38      k_38
##   <fct>     <fct>                <chr>    <dbl>
## 1 ALTAVISTA BUGA PATIO BONITO    G     0.00595 
## 2 ALTAVISTA EL JARDÍN            G     0.0125  
## 3 ALTAVISTA LA ESPERANZA         G     0.000352
## 4 ALTAVISTA SAN PABLO            G     0.00154 
## 5 ARANJUEZ  BERLÍN               G     0.000502
## 6 ARANJUEZ  BERMEJAL- LOS ÁLAMOS G     0.000699

Pregunta de la encuesta p_43.

¿Que medio de transporte utiliza predominantemente para dirigirse a su centro educativo?

Posibles respuestas a la pregunta.
  • -98 No sabe
  • -88 No aplica
  • -77 Otro.
  • 1 Caminando
  • 2 Bicicleta
  • 3 Moto
  • 4 Bus/Buseta/Ejecutivo
  • 5 Transporte Informal
  • 6 Taxi/Colectivo
  • 7 Transporte Privado
  • 8 Metro/Cable
  • 9 Sistema integrado de transporte (SIT).
  • 10 Caballo (bestia)
  • 11 Lancha, Canoa, Bote

Variable que se desea medir.

Indicador.
  • Porcentaje de estudiantes que utilizan el transporte publico para dirigirse al centro educativo.
Formula
  • Numero de encuestas que responden que utiliza servicio publico / Total por Barrio

Para consolidar la variable en terminos de indicador se consolidaron las repuestas de la pregunta p_43 en los siguientes grupos:

  • No sabe -98
  • No aplica -88
  • Otro. -77
  • Caminando 1
  • Privado 2 - (Bicicleta,Moto,Transporte Informal,Transporte Privado)
  • Publico 3 - (Bus/Buseta/Ejecutivo,Taxi/Colectivo,Metro/Cable,Sistema integrado de transporte (SIT))
  • Animal 4 - Caballo (bestia)
  • Fluvial 5 - Lancha, Canoa, Bote
## # A tibble: 6 x 4
##   comuna    barrio                         p_43    k_43
##   <fct>     <fct>                          <chr>  <dbl>
## 1 ALTAVISTA AGUAS FRÍAS                    3     0.0476
## 2 ALTAVISTA ALTAVISTA CENTRAL              3     0.0651
## 3 ALTAVISTA ÁREA DE EXPANSIÓN ALTAVISTA    3     0.0622
## 4 ALTAVISTA ÁREA DE EXPANSIÓN BELÉN RINCÓN 3     0.0647
## 5 ALTAVISTA BUGA PATIO BONITO              3     0.107 
## 6 ALTAVISTA CABECERA ALTAVISTA             3     0.0595

Pregunta de la encuesta p_44.

¿Cuanto tiempo tarda en llegar a su centro educativo?

Posibles respuestas a la pregunta.
  • -99 No responde
  • -98 No sabe
  • -88 No aplica
  • 1 De 0 a 20 minutos
  • 2 De 21 a 40 minutos
  • 3 De 41 a 60 minutos
  • 4 De 61 a 80 minutos
  • 5 Más de 81 minutos
Variable que se desea medir.
Rango de tiempo en que se tarda en llegar a un centro educativo por barrio en Medellin.
Configuración de indicadores para la pregunta p_44.
Indicador definido.
  • Porcentajes de estudiantes que se demoran mas de 41 minutos para llegar a su centro educativo.
Formula.
  • Numero de encuestas donde se selecciona 2 como respuesta / Total de encuestas x Barrio.

Generación de indicador para p_44

## # A tibble: 6 x 4
##   comuna    barrio                         p_44     k_44
##   <fct>     <fct>                          <chr>   <dbl>
## 1 ALTAVISTA AGUAS FRÍAS                    2     0.0238 
## 2 ALTAVISTA ALTAVISTA CENTRAL              2     0.0335 
## 3 ALTAVISTA ÁREA DE EXPANSIÓN ALTAVISTA    2     0.0373 
## 4 ALTAVISTA ÁREA DE EXPANSIÓN BELÉN RINCÓN 2     0.0474 
## 5 ALTAVISTA BUGA PATIO BONITO              2     0.0476 
## 6 ALTAVISTA CABECERA ALTAVISTA             2     0.00595

Pregunta de la encuesta p_45

¿Último nivel de estudio aprobado (Titulo)?

Posibles respuestas a la pregunta.
  • -99 No responde
  • -98 No sabe
  • 0 Ninguno
  • 1 Salacuna, Guardería, Preescolar
  • 2 Primaria
  • 3 Secundaria
  • 4 Media académica o Normalista
  • 5 Media Técnica
  • 6 Tecnológico
  • 7 Universidad
  • 8 Especializacion
  • 9 Maestria
Variable que se desea medir.
Indicador.
  • Porcentaje de personas con educacion superior (respuestas 6,7,8,9).

Generacio de indicador para p_45

## # A tibble: 6 x 4
##   comuna    barrio                         p_45    k_45
##   <fct>     <fct>                          <chr>  <dbl>
## 1 ALTAVISTA AGUAS FRÍAS                    2     0.0159
## 2 ALTAVISTA ALTAVISTA CENTRAL              2     0.0316
## 3 ALTAVISTA ÁREA DE EXPANSIÓN ALTAVISTA    2     0.112 
## 4 ALTAVISTA ÁREA DE EXPANSIÓN BELÉN RINCÓN 2     0.362 
## 5 ALTAVISTA BUGA PATIO BONITO              2     0.0268
## 6 ALTAVISTA CABECERA ALTAVISTA             2     0.0119

Generación de la tabla final para proceso de Cluster.

Union de los indicadores de la dimension.

  1. Creo un dataFrame con todos los barrios contenidos en las encuestas.
##      comuna                         barrio       k_35        k_37
## 1 ALTAVISTA                    AGUAS FRÍAS 0.13492063 0.015873016
## 2 ALTAVISTA              ALTAVISTA CENTRAL 0.14201183 0.017751479
## 3 ALTAVISTA    ÁREA DE EXPANSIÓN ALTAVISTA 0.14937759 0.020746888
## 4 ALTAVISTA ÁREA DE EXPANSIÓN BELÉN RINCÓN 0.05172414 0.025862069
## 5 ALTAVISTA              BUGA PATIO BONITO 0.12797619 0.020833333
## 6 ALTAVISTA             CABECERA ALTAVISTA 0.11309524 0.005952381
##          k_38       k_43        k_44       k_45
## 1 0.000000000 0.04761905 0.023809524 0.01587302
## 2 0.000000000 0.06508876 0.033530572 0.03155819
## 3 0.000000000 0.06224066 0.037344398 0.11203320
## 4 0.000000000 0.06465517 0.047413793 0.36206897
## 5 0.005952381 0.10714286 0.047619048 0.02678571
## 6 0.000000000 0.05952381 0.005952381 0.01190476

Proceso de Normalización de datos para desarrollo de Cluster.

Proceso de escalamiento de datos

##                                                k_35        k_37       k_38
## ALTAVISTA/AGUAS FRÍAS                     0.9803570 -0.07559387 -0.5040064
## ALTAVISTA/ALTAVISTA CENTRAL               1.1366107  0.10847324 -0.5040064
## ALTAVISTA/ÁREA DE EXPANSIÓN ALTAVISTA     1.2989142  0.40198772 -0.5040064
## ALTAVISTA/ÁREA DE EXPANSIÓN BELÉN RINCÓN -0.8528670  0.90321472 -0.5040064
## ALTAVISTA/BUGA PATIO BONITO               0.8273371  0.41045834  3.9697256
## ALTAVISTA/CABECERA ALTAVISTA              0.4994372 -1.04769828 -0.5040064
##                                                k_43        k_44       k_45
## ALTAVISTA/AGUAS FRÍAS                    -0.7236779 -0.03056668 -0.9246057
## ALTAVISTA/ALTAVISTA CENTRAL              -0.2983898  0.40288060 -0.8159130
## ALTAVISTA/ÁREA DE EXPANSIÓN ALTAVISTA    -0.3677246  0.57293352 -0.2582497
## ALTAVISTA/ÁREA DE EXPANSIÓN BELÉN RINCÓN -0.3089451  1.02191307  1.4744095
## ALTAVISTA/BUGA PATIO BONITO               0.7253885  1.03106506 -0.8489845
## ALTAVISTA/CABECERA ALTAVISTA             -0.4338646 -0.82679049 -0.9521043

Proceso de Cluster K-Means.

1. Proceso de selección del K optimo para la clusterizacion de K-Means.

Diferencia de los errores

Generacion de los Clusters con el K recomendado.

Como se identifica en la grafica del codo y la de siluetas, el K optimo para generar las agrupaciones en el metodo K-means es 4.

Según el algoritmo, se generaron 4 grupos distribuidos de la siguiente forma :

  • Cluster 1 -> 8 Barrios.
  • Cluster 2 -> 178 Barrios.
  • Cluster 3 -> 23 Barrios.
  • Cluster 4 -> 101 Barrios.

La distribucion numerica de los grupos es generado a partir de la siguiente instrucción. kmeans_4$size

Grafico de radar para Clusters

Antes de iniciar los analisis de los grupos, se realizo un proceso de calculo de los minimos, maximos y media de la data real recogida en las encuestas con el proposito de realizar unos graficos de radar y poder hacer un analísis que nos permita entregar mayor detalle de lo que sucede en cada cluster. Al revisar los graficos a simple vista encontramos que existen varios indicadores que realmente no aportan mucho en el momento de definir los grupos. Tambien se procede a consultar los indicadores fundamentales que nos permiten validar la fortaleza del modelo, garantizando la menor varianza dentro del cluster (within_SS) y la maxima varianza entre los grupos (between_SS) y así calculando su ajuste.

  • between_SS = 860.3908
  • total_SS = 1854
  • between_SS / total_SS (Varianza de la data) = 46,40272%

En este caso el ajuste tiene un valor bajo. Aquí tenemos 2 alternativas para aumentar el nivel del ajuste :

  • Aumentar el tamaño de K, pero con esta alternativa corremos el riesgo de perder el equilibrio de los grupos pues si aumentamos el K lo que hacemos es dividir más los grupos hasta que el valor de las varianzas de los grupos sea igual al total de todas las varianzas y no estariamos respetando los graficos que recomiendan un k de grupos optimo.

  • Disminuir la cantidad de variables dejando solo las variables que realmente aportan a la definición de los grupos. En este caso se utilizará PCA para encontrar los componentes que puedan tener un mayor porcentaje de determinacion de los grupos.

Se decide realizar un analisis de componentes mediante la aplicación de PCA al conjunto de indicadores.

Analísis de PCA

Al realizar el proceso de PCA en el grafico vemos que los compenentes 1, 2 y 3 explican el 96% de los cluster. Para poder identificar cuales indicadores componen dichos componentes realizamos un proceso de contribución.

Con el proceso de contribución encontramos que los indicadores k_37 y k_38 no aportan nada en la composición de los grupos en ninguno de los 3 componentes seleccionados. Es por esto que para seguir el analisis trabajaremos con los siguientes indicadores:

  • k_35 Nivel de Analfabetismo en los Barrios de Medellín.
  • k_43 Porcentaje de estudiantes que utilizan el transporte publico para dirigirse al centro educativo?
  • k_44 Porcentajes de estudiantes que se demoran mas de 41 minutos para llegar a su centro educativo.
  • k_45 Porcentaje de personas con educacion superior

Generación de los Clusters.

Nuevamente se generan los clusters con la nueva parametrización de indicadores con K = 4. Obteniendo.

Después de eliminar los dos indicadores que no tenian ningun poder explicativo para los grupos, vemos nuevamente que en el grafico de cluster los grupos estan más definidos y no se solapan tanto como en la primera corrida del modelo.

Revisando de nuevo el indicador propio de evaluación, tenemos :

between_SS = 747.8616 se encuentra un total_SS = 1236 between_SS / total_SS (Varianza de la data) = 60.5066%

De esta forma, se procede entonces a generar de nuevo los graficos de radar.

Analisis de los Clusters

Indicadores claves para analisis.

Después del ejercicio realizado para eliminar indicadores, estas fueron las preguntas finales.

  • p_35 Nivel de Analfabetismo en los Barrios de Medellín.

  • p_43 Porcentaje de estudiantes que utilizan el transporte publico para dirigirse al centro educativo?

  • p_44 Porcentajes de estudiantes que se demoran mas de 41 minutos para llegar a su centro educativo.

  • p_45 Porcentaje de personas con educacion superior

Los grupos generados por el algoritmo K-means para la encuesta que estudia la dimensión de educación para el estudio Medellín como Vamos, muestra que la educación en los barrios de Medellin se dividen en 4 grupos que son determinados por :

  • El nivel de analfabetismo.
  • El medio de transporte en el que se dirigen a su sitio de educación.
  • El tipo que demoran en ir a su lugar de estudio.
  • El nivel de estudios superiores que la persona curso.

El Cluster número 1, se diferencia de los demas grupos porque las personas que se dirigen a estudar su mayoria no se demoran más de 41 minutos, solo menos del 3% de los encuentados tienen esta particularidad. Solo un poco más del 10% tienen estudios superiores, menos del 10% utilizan el trasporte publico para dirigirse al sitio de estudio, temas comprensible debido a que menos del 3% estudian en sitios lejanos. El nivel de analfabetismo ronda en un 7% de las perosonas encuestadas. El cluster 1 esta comprenido en 130 barrios dispersos en todo el valle de la aburra. Los barrios son :

barrio
9 ALTAVISTA/LA ESPERANZA
12 ARANJUEZ/ARANJUEZ
13 ARANJUEZ/BASILIA
14 ARANJUEZ/BERLÍN
15 ARANJUEZ/BERMEJAL- LOS ÁLAMOS
16 ARANJUEZ/CAMPO VALDÉS Nº 1
17 ARANJUEZ/LA PIÑUELA
19 ARANJUEZ/MANRIQUE CENTRAL Nº 1
20 ARANJUEZ/MIRANDA
22 ARANJUEZ/PALERMO
23 ARANJUEZ/SAN ISIDRO
24 ARANJUEZ/SAN PEDRO
25 ARANJUEZ/SEVILLA
26 BELEN/ALTAVISTA
31 BELEN/EL RINCÓN
35 BELEN/LA HONDONADA
39 BELEN/LAS MERCEDES
40 BELEN/LAS PLAYAS
42 BELEN/LOS ALPES
46 BELEN/SAN BERNARDO
47 BUENOS AIRES/ALEJANDRO ECHAVARRÍA
48 BUENOS AIRES/BARRIO CAYCEDO
49 BUENOS AIRES/BARRIOS DE JESÚS
50 BUENOS AIRES/BOMBONA Nº 2
51 BUENOS AIRES/BUENOS AIRES
52 BUENOS AIRES/CATALUÑA
53 BUENOS AIRES/EL SALVADOR
54 BUENOS AIRES/GERONA
56 BUENOS AIRES/LA ASOMADERA Nº 1
59 BUENOS AIRES/LA MILAGROSA
60 BUENOS AIRES/LORETO
61 BUENOS AIRES/LOS CERROS EL VERJEL
62 BUENOS AIRES/MIRA FLORES
64 CASTILLA/ALFONSO LÓPEZ
65 CASTILLA/BELALCAZAR
66 CASTILLA/BOYACÁ
67 CASTILLA/CARIBE
68 CASTILLA/CASTILLA
70 CASTILLA/FLORENCIA
71 CASTILLA/FRANCISCO ANTONIO ZEA
72 CASTILLA/GIRARDOT
73 CASTILLA/HÉCTOR ABAD GÓMEZ
74 CASTILLA/LAS BRISAS
75 CASTILLA/PROGRESO
76 CASTILLA/TEJELO
77 CASTILLA/TOSCANA
78 CASTILLA/TRICENTENARIO
80 DOCE DE OCTUBRE/DOCE DE OCTUBRE Nº 2
85 DOCE DE OCTUBRE/PEDREGAL
94 EL POBLADO/BARRIO COLOMBIA
113 GUAYABAL/CAMPO AMOR
114 GUAYABAL/CRISTO REY
115 GUAYABAL/GUAYABAL
116 GUAYABAL/LA COLINA
117 GUAYABAL/SAN PABLO
118 GUAYABAL/SANTA FE
120 LA AMERICA/BARRIO CRISTÓBAL
124 LA AMERICA/EL DANUBIO
129 LA AMERICA/SANTA LUCIA
133 LA CANDELARIA/BARRIO COLON
134 LA CANDELARIA/BOMBONA Nº 1
136 LA CANDELARIA/CORAZÓN DE JESÚS
137 LA CANDELARIA/EL CHAGUALO
139 LA CANDELARIA/GUAYAQUIL
140 LA CANDELARIA/JESÚS NAZARENO
142 LA CANDELARIA/LAS PALMAS
144 LA CANDELARIA/PRADO
145 LA CANDELARIA/SAN BENITO
160 LAURELES-ESTADIO/NARANJAL
164 MANRIQUE/EL POMAR
170 MANRIQUE/MANRIQUE ORIENTAL
176 MANRIQUE/VERSALLES Nº 1
178 PALMITAS/CORREGIMIENTO PALMITAS
185 PALMITAS/URQUITA
200 ROBLEDO/AURES Nº 1
203 ROBLEDO/BELLO HORIZONTE
204 ROBLEDO/BOSQUES DE SAN PABLO
205 ROBLEDO/CERRO EL VOLADOR
206 ROBLEDO/CÓRDOBA
207 ROBLEDO/CUCARACHO
208 ROBLEDO/EL DIAMANTE
209 ROBLEDO/FUENTE CLARA
211 ROBLEDO/LÓPEZ DE MESA
212 ROBLEDO/MONTECLARO
215 ROBLEDO/PAJARITO
216 ROBLEDO/PALENQUE
217 ROBLEDO/ROBLEDO
218 ROBLEDO/SAN GERMÁN
220 ROBLEDO/VILLA FLORA
222 SAN ANTONIO DE PRADO/CABECERA SAN ANT DE PR.
225 SAN ANTONIO DE PRADO/LA FLORIDA
228 SAN ANTONIO DE PRADO/POTRERITO
230 SAN ANTONIO DE PRADO/YARUMALITO
231 SAN CRISTOBAL/AREA DE EXPANCION SAN CRISTOBAL
234 SAN CRISTOBAL/CABECERA SAN CRISTÓBAL
238 SAN CRISTOBAL/EL PATIO
240 SAN CRISTOBAL/EL UVITO
241 SAN CRISTOBAL/EL YOLOMBO
245 SAN CRISTOBAL/LA PALMA
246 SAN CRISTOBAL/LAS PLAYAS
247 SAN CRISTOBAL/NARANJAL
248 SAN CRISTOBAL/PAJARITO
251 SAN CRISTOBAL/TRAVESÍAS
252 SAN JAVIER/ANTONIO NARIÑO
253 SAN JAVIER/BELENCITO
254 SAN JAVIER/BETANIA
256 SAN JAVIER/EDUARDO SANTOS
257 SAN JAVIER/EL CORAZÓN
262 SAN JAVIER/LA PRADERA
264 SAN JAVIER/LOS ALCÁZARES
265 SAN JAVIER/METROPOLITANO
267 SAN JAVIER/SAN JAVIER Nº 1
268 SAN JAVIER/SAN JAVIER Nº 2
269 SAN JAVIER/SANTA ROSA DE LIMA
270 SAN JAVIER/VEINTE DE JULIO
282 SANTA ELENA/BARRO BLANCO
286 SANTA ELENA/EL PLAN
287 SANTA ELENA/LAS PALMAS
288 SANTA ELENA/MAZO
289 SANTA ELENA/MEDIA LUNA
290 SANTA ELENA/PIEDRA GORDA
292 SANTA ELENA/SANTA ELENA SECTOR CENTRAL
293 VILLA HERMOSA/BATALLÓN GIRARDOT
295 VILLA HERMOSA/ENCISO
296 VILLA HERMOSA/LA LADERA
298 VILLA HERMOSA/LA MANSIÓN
302 VILLA HERMOSA/LOS MANGOS
304 VILLA HERMOSA/SAN MIGUEL
305 VILLA HERMOSA/SUCRE
307 VILLA HERMOSA/VILLA HERMOSA

Este cluster comprenden comunas donde la mayoria de sus habitantes pertenecen a una clase obrera trabajadora.

El Cluster numero 2, se diferencia de los demas grupos debido a que el 23% las personas que viven en estos barrios, utilizan el transporte publico para dirigirse al lugar de estudio. La segunda variable más notoria es el analfabetismo, con al rededor del 18%. Las dos variables restantes tienen un comportamiento menor. El cluster 2 esa conformado por 3 barrios estos son:

barrio
236 SAN CRISTOBAL/EL CARMELO
243 SAN CRISTOBAL/LA ILUSIÓN
250 SAN CRISTOBAL/SAN JOSE DE LA MONTAÑA

Este clustes nos permite concluir que hace fata una institucion educativa cerca a la comunidad que permita elevar la calidad de vida de los habitantes pues gran cantidad de personas deben deplazarse mas de 41 minutos a un sitio de educacion.

El Clustes 3, Este grupo se caracteriza porque tiene los indicadores más regulares que los otros grupos, tres de cuatro indicadores de estudio tiene un comportamiento parejo, el analfabetismo tiene un leve incremento con respecto a los demas. El indicador k_45 (Estudios superiores) tiene un leve decenso. Esto puede ocurrir debido a que las personas de estos barrios son de mayores posibilidades. Los barrios que hacen parte de este cluster son:

barrio
1 ALTAVISTA/AGUAS FRÍAS
2 ALTAVISTA/ALTAVISTA CENTRAL
3 ALTAVISTA/ÁREA DE EXPANSIÓN ALTAVISTA
5 ALTAVISTA/BUGA PATIO BONITO
6 ALTAVISTA/CABECERA ALTAVISTA
7 ALTAVISTA/EL CORAZÓN EL MORRO
8 ALTAVISTA/EL JARDÍN
10 ALTAVISTA/SAN JOSÉ DEL MANZANILLO
11 ALTAVISTA/SAN PABLO
18 ARANJUEZ/LAS ESMERALDAS
21 ARANJUEZ/MORAVIA
41 BELEN/LAS VIOLETAS
55 BUENOS AIRES/JUAN PABLO II
63 BUENOS AIRES/OCHO DE MARZO
69 CASTILLA/DESCONOCIDO
79 DOCE DE OCTUBRE/DOCE DE OCTUBRE Nº 1
81 DOCE DE OCTUBRE/EL TRIUNFO
82 DOCE DE OCTUBRE/KENNEDY
83 DOCE DE OCTUBRE/LA ESPERANZA
84 DOCE DE OCTUBRE/MIRADOR DEL DOCE
86 DOCE DE OCTUBRE/PICACHITO
87 DOCE DE OCTUBRE/PICACHO
88 DOCE DE OCTUBRE/PROGRESO  Nº 2
89 DOCE DE OCTUBRE/SAN MARTÍN DE PORRES
90 DOCE DE OCTUBRE/SANTANDER
119 GUAYABAL/TRINIDAD
138 LA CANDELARIA/ESTACIÓN VILLA
163 MANRIQUE/CAMPO VALDES Nº 2
165 MANRIQUE/EL RAIZAL
166 MANRIQUE/LA CRUZ
167 MANRIQUE/LA SALLE
168 MANRIQUE/LAS GRANJAS
169 MANRIQUE/MANRIQUE CENTRAL Nº 2
171 MANRIQUE/MARIA CANO - CARAMBOLAS
172 MANRIQUE/ORIENTE
173 MANRIQUE/SAN JOSE LA CIMA Nº 2
174 MANRIQUE/SAN JOSELA CIMA Nº 1
175 MANRIQUE/SANTA INES
177 MANRIQUE/VERSALLES Nº 2
179 PALMITAS/LA ALDEA
180 PALMITAS/LA FRISOLA
181 PALMITAS/LA SUCIA
182 PALMITAS/LA SUIZA
183 PALMITAS/POTRERA MISERENGA
184 PALMITAS/SECTOR CENTRAL
186 PALMITAS/VOLCANA GUAYABAL
187 POPULAR/ALDEA PABLO VI
188 POPULAR/CARPINELO
189 POPULAR/EL COMPROMISO
190 POPULAR/GRANIZAL
191 POPULAR/LA AVANZADA
192 POPULAR/LA ESPERANZA Nº 2
193 POPULAR/MOSCU Nº 2
194 POPULAR/POPULAR
195 POPULAR/SAN PABLO
196 POPULAR/SANTO DOMINGO SABIO Nº 1
197 POPULAR/SANTO DOMINGO SABIO Nº 2
198 POPULAR/VILLA GUADALUPE
201 ROBLEDO/AURES Nº 2
213 ROBLEDO/NUEVA VILLA DE LA IGUANA
214 ROBLEDO/OLAYA HERRERA
219 ROBLEDO/SANTA MARGARITA
221 SAN ANTONIO DE PRADO/AREA EXPANSION SAN ANTONIO DE PRADO
223 SAN ANTONIO DE PRADO/EL ASTILLERO
224 SAN ANTONIO DE PRADO/EL SALADO
226 SAN ANTONIO DE PRADO/LA VERDE
227 SAN ANTONIO DE PRADO/MONTAÑITA
229 SAN ANTONIO DE PRADO/SAN JOSÉ
232 SAN CRISTOBAL/AREA EXPANSION PAJARITO
233 SAN CRISTOBAL/BOQUERÓN
235 SAN CRISTOBAL/CIUDADELA NUEVO OCCIDENTE
237 SAN CRISTOBAL/EL LLANO
239 SAN CRISTOBAL/EL PICACHO
242 SAN CRISTOBAL/LA CUCHILLA
244 SAN CRISTOBAL/LA LOMA
249 SAN CRISTOBAL/PEDREGAL ALTO
255 SAN JAVIER/BLANQUIZAL
258 SAN JAVIER/EL PESEBRE
259 SAN JAVIER/EL SALADO
260 SAN JAVIER/EL SOCORRO / LA GABRIELA
261 SAN JAVIER/JUAN XXIII - LA QUIEBRA
263 SAN JAVIER/LAS INDEPENDENCIAS
266 SAN JAVIER/NUEVOS CONQUISTADORES
271 SANTA CRUZ/ANDALUCIA
272 SANTA CRUZ/EL PLAYON DE LOS COMUNEROS
273 SANTA CRUZ/LA FRANCIA
274 SANTA CRUZ/LA FRONTERA
275 SANTA CRUZ/LA ISLA
276 SANTA CRUZ/LA ROSA
277 SANTA CRUZ/MOSCU Nº 1
278 SANTA CRUZ/PABLO VI
279 SANTA CRUZ/SANTA CRUZ
280 SANTA CRUZ/VILLA DEL SOCORRO
281 SANTA CRUZ/VILLA NIZA
284 SANTA ELENA/EL LLANO
285 SANTA ELENA/EL PLACER
291 SANTA ELENA/PIEDRAS BLANCAS
294 VILLA HERMOSA/EL PINAL
297 VILLA HERMOSA/LA LIBERTAD
299 VILLA HERMOSA/LA SIERRA
300 VILLA HERMOSA/LAS ESTANCIAS
301 VILLA HERMOSA/LLANADITAS
303 VILLA HERMOSA/SAN ANTONIO
306 VILLA HERMOSA/TRECE DE NOVIEMBRE
308 VILLA HERMOSA/VILLA LILIAM
309 VILLA HERMOSA/VILLA TINA
310 VILLA HERMOSA/VILLA TURBAY

El Cluster 4, Este cluster se difencia de los otros grupos por su bajo porcentaje de analfabetismo y su alto porcentaje de personas con educación superior. Las personas que viven en los barrios pertenecientes a este grupo utilizan poco el transporte urbano y en promedio sedemoran poco para llegar a su lugar de estudio. Este grupo al parecer corresponde a u grupo aspiracional debido a que las personas con mejores oportunidades para tener estudio superiores llegan a este grupo. Los barrios que hacen parte de este cluster son:

barrio
4 ALTAVISTA/ÁREA DE EXPANSIÓN BELÉN RINCÓN
27 BELEN/BELÉN
28 BELEN/CERRO NUTIBARA
29 BELEN/DIEGO ECHAVARRÍA
30 BELEN/EL NOGAL - LOS ALMENDROS
32 BELEN/FÁTIMA
33 BELEN/GRANADA
34 BELEN/LA GLORIA
36 BELEN/LA LOMA DE LOS BERNAL
37 BELEN/LA MOTA
38 BELEN/LA PALMA
43 BELEN/MIRAVALLE
44 BELEN/NUEVA VILLA DE ABURRA
45 BELEN/ROSALES
57 BUENOS AIRES/LA ASOMADERA Nº 2
58 BUENOS AIRES/LA ASOMADERA Nº 3
91 EL POBLADO/ALEJANDRÍA
92 EL POBLADO/ALTOS DEL POBLADO
93 EL POBLADO/ASTORGA
95 EL POBLADO/CASTROPOL
96 EL POBLADO/EL CASTILLO
97 EL POBLADO/EL DIAMANTE Nº 2
98 EL POBLADO/EL POBLADO
99 EL POBLADO/EL TESORO
100 EL POBLADO/LA AGUACATALA
101 EL POBLADO/LA FLORIDA
102 EL POBLADO/LALINDE
103 EL POBLADO/LAS LOMAS Nº 1
104 EL POBLADO/LAS LOMAS Nº 2
105 EL POBLADO/LOS BALSOS Nº 1
106 EL POBLADO/LOS BALSOS Nº 2
107 EL POBLADO/LOS NARANJOS
108 EL POBLADO/MANILA
109 EL POBLADO/PATIO BONITO
110 EL POBLADO/SAN LUCAS
111 EL POBLADO/SANTA MARIA DE LOS ÁNGELES
112 EL POBLADO/VILLA CARLOTA
121 LA AMERICA/CALAZANS
122 LA AMERICA/CALAZANS PARTE ALTA
123 LA AMERICA/CAMPO ALEGRE
125 LA AMERICA/FERRINI
126 LA AMERICA/LA AMÉRICA
127 LA AMERICA/LA FLORESTA
128 LA AMERICA/LOS PINOS
130 LA AMERICA/SANTA MÓNICA
131 LA AMERICA/SANTA TERESITA
132 LA AMERICA/SIMÓN BOLIVAR
135 LA CANDELARIA/BOSTON
141 LA CANDELARIA/LA CANDELARIA
143 LA CANDELARIA/LOS ÁNGELES
146 LA CANDELARIA/SAN DIEGO
147 LA CANDELARIA/VILLA NUEVA
148 LAURELES-ESTADIO/BOLIVARIANA
149 LAURELES-ESTADIO/CARLOS E RESTREPO
150 LAURELES-ESTADIO/CUARTA BRIGADA
151 LAURELES-ESTADIO/EL VELÓDROMO
152 LAURELES-ESTADIO/ESTADIO
153 LAURELES-ESTADIO/FLORIDA NUEVA
154 LAURELES-ESTADIO/LA CASTELLANA
155 LAURELES-ESTADIO/LAS ACACIAS
156 LAURELES-ESTADIO/LAURELES
157 LAURELES-ESTADIO/LORENA
158 LAURELES-ESTADIO/LOS COLORES
159 LAURELES-ESTADIO/LOS CONQUISTADORES
161 LAURELES-ESTADIO/SAN JOAQUÍN
162 LAURELES-ESTADIO/SURAMERICANA
199 ROBLEDO/ALTAMIRA
202 ROBLEDO/BARRIO FACULTAD DE MINAS
210 ROBLEDO/LA PILARICA
283 SANTA ELENA/EL CERRO

Grafico apilado de barras

Comportamiento de preguntas por cluster

Generacion de Mapa de distribucion de cluster.

Convertimos a minúsculas

Conclusión del Cluster.

Después de analízar el cluster y teniendo en cuenta el proposito general del estudio de la alcaldia de Medellín, podemos concluir que según la distribución del cluster, Se evidencia que los grupos no poseen una alta variación a diferencia de un grupo conformado por 3 barrios ubicados en San Cristobal los cuales estan ubicados en zona rural, un caso puntual con oportunidades para solucionar esta situación. De resto las variables utilizadas para medir la educación en los barrios tienen un comportamiento igual. Las diferencias que definen los grupos de este estudio son el tiempo que se toma una persona en desplazarse a el sitio de estudio y el porcentaje de personas con educación superior. Para identificar el poder de estas respuestas es necesario realizar un estudio adicional si dichas personas hacen parte de una población la cual esta cursando estudio superiores y de la misma forma si las personas que van realizando estudios superiores migran a otros barrios de mayor nivel, esto podria explicar la potencia de estas dos variables. De otra forma podemos concluir que segun la dimensión educación Medellín posee calidad de vida para sus habitantes, los grupos muestra que no se evidencia mayor diferencia entre sus grupos.